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Синтез функцій класифікації на основі 
генетичних алгоритмів 


У даній статті запропонований метод побудови роздільних поверхонь на основі генетичних алгоритмів. 
Розроблений спосіб розбиття простору ознак на класи дає можливість вибрати оптимальні за складністю 
поліноми, які описують роздільні криві. Ефективність такого методу підтверджена промисловими даними. 
Отримані результати відкривають можливості для здійснення оперативного технічного діагностування 1 
виявлення окремих вузлів газоперекачувального агрегату з критичним рівнем вібрації, що робить можливою 
його безаварійну експлуатацію. 


Вступ 


Діагностування різноманітних об'єктів грунтується на визначенні їх технічних 
станів, які характеризуються певною сукупністю діагностичних ознак. Діагностичні 
ознаки утворюють багатовимірний простір, який необхідно розбити на класи, кожний 
із яких характеризує технічний стан об'єкта, що діагностується. Для визначення гра- 
ниць класів використовують поліноміальні роздільні функції другого порядку і вище |11. 
При цьому апріорі допускається, що структура такої функції наперед відома і задачею 
побудови класифікатора на основі роздільних функції є визначення її параметрів, які 
розраховуються, як правило, методом найменших квадратів (2). Насправді від струк- 
тури роздільної функції значною мірою залежить ймовірність хибної відмови під час 
діагностування, 1 така структура, як правило, наперед невідома. 

Метою даної роботи є розробка методу побудови роздільних поверхонь на ос- 
нові генетичних алгоритмів, що дозволить вибрати оптимальну структуру полінома, 
який описує таку поверхню. 


Методи побудови функцій класифікації 


Допускається, що у просторі ознак кожна діагностична ознака віднесена до пев- 
ного класу. Необхідно побудувати роздільну поверхню між першим і другим класами; 
потім між другим 1 третім класами 1 т.д. Отже, задача побудови роздільних функцій 
між М класами зводиться до побудови роздільних функцій між двома класами. 

Нехай перший клас вміщує М, , а другий відповідно - МУ, діагностичних ознак. 


Тоді алгоритм знаходження роздільної функції між двома класами грунтується на мі- 
німізації наступного функціонала (21: 


кача Хата) о (Ля) ні), 0 


о іі у ізі 


деас- РЯДУ ПРО Я, - вектор параметрів роздільної функції; 
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5 (ха ) - роздільна функція, така, що для першого класу / (х"а ) ж 1, а для дру- 


гого - 7(х",а)я -1; 


Х' - вектор координат діагностичних ознак в т -вимірному просторі (індекс «0» 
означає, що діагностична ознака відноситься до першого класу, а індекс «ум» відно- 
сить діагностичну ознаку до другого класу). 


Якщо функцію /(х,а) вибрати лінійною відносно її параметрів 


Г(са)- аюФ, (о) (2) 
Кке0 
то мінімізація функціонала (1) за вектором параметрів а приводить до такого матрич- 
ного рівняння: 


дазр, (3) 
де А - квадратна матриця розміром м, елементи якої 


1 Ма Я щі 1 р мі шумі 
гне н Уо(абь (ж): Ф 


о із ум і-І 


1 б --0і І ка -омі . бо 1 
Бу заг 39 зе ), дк ебп-1. (5) 


о із у і-Ї 


У тому випадку, коли роздільна поверхня описується поліномом степені г 


п-1 т 
7(оа)-2 а. ЦП (6) 
Ка0 меї 


де п - Кількість членів полінома; 
ак - коефіцієнти полінома; 


п 
5 я 7 СТепені аргументів, які повинні задовольняти обмеженню ра «к 
узі 
Число членів п полінома (6) визначають за такою формулою |З3| 
(т й г) ! 
в орерней (7) 
тії! 

Знайдена за допомогою мінімізації функціонала (1) роздільна функція (2) має 
суттєвий недолік |2|, який полягає у тому, що структура функції класифікації зале- 
жить від щільності розподілу діагностичних ознак, віддалених від межі між класами. 
На практиці щільність діагностичних ознак біля межі, як правило, менша ніж на від- 
даленні від межі, що приводить до невідповідності отриманої роздільної функції дійс- 
ній межі між класами. 

Для синтезу ефективної роздільної функції необхідно враховувати діагностичні 
ознаки, які близькі до межі між класами у більшій степені ніж віддалені від неї. Це до- 
сягається |2| уведенням у структуру функціонала (1) експоненціальної вагової функції 


т(/у-ей", (8) 


де а 1 й - параметри, що визначають швидкість зменшення функції (8) при віддален- 
ні від нульового значення. 
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Із врахуванням вагової функції (8) функціонал (1) набуде такого значення |21: 


Е(а)ечучучч | . У (гомма (ема) з 
ба) 
ке (еяун) 9 
т (ха) 7 


Таким чином, якщо рівняння роздільної кривої вибрано у вигляді полінома (б), 
то задача синтезу відповідної роздільної функції між двома класами діагностичних 03- 
нак зводиться не тільки до визначення вектора параметрів а шляхом мінімізації функ- 
ціонала (9), але й до знаходження структури полінома (6), такої, щоб функціонал (9) 
набув мінімального значення. 


Синтез структури полінома для роздільної функції 


На практиці, як правило, структура роздільної функції (6) невідома, що приводить 
до необхідності довільного вибору як числа функцій, так і вигляду самих функцій у 
виразі (6). 

Утворимо упорядковану структуру довжиною "7, в якій на К -му місці буде стоя- 
ти одиниця або нуль залежно від того, чи параметр а,, Кк - 0, п-1 роздільної функції (6) 
відмінний від нуля, чи нульовий. У теорії генетичних алгоритмів така упорядкована 
послідовність має назву хромосоми або особини, а атомарний елемент хромосоми (оди- 
ниця або нуль) - це ген. Набір хромосом утворює популяцію. Важливим поняттям у 
теорії генетичних алгоритмів є функція пристосування, яка визначає ступінь присто- 
сування окремих особин у популяції. Вона дає змогу із всієї популяції вибрати 
особини, які є найбільш пристосованими, тобто такі, які мають найбільше (найменше) 
значення функції пристосування. У задачі синтезу структури роздільної функції 
функцією пристосованості виступає функціонал (9). 

Таким чином, задачу синтезу роздільної функції сформуємо наступним чином: 
із початкової популяції хромосом шляхом еволюційного відбору вибрати таку хромо- 
сому, яка забезпечує найкраще значення функції пристосування (мінімальне значення 
функціонала (9)). 

Генетичний алгоритм складається із наступних кроків |4|. 

КІ. Формування початкової популяції (ініціалізація). На першому кроці ро- 
боти алгоритму випадковим чином формується популяція із / особин, кожна із яких 
є хромосомою довжиною п . Число генів у хромосомі визначається формулою (7). 

К2. Оцінка пристосованості хромосоми у популяції. Для кожної хромосоми 
обчислюється функціонал (9). Здійснюється така процедура наступним чином. Фор- 
мується поліном / -ї степені, який асоційований з відповідною хромосомою із популя- 
ції 7 , тобто у такому поліномі присутні тільки А -і коефіцієнти, якщо на К -х позиціях 
хромосоми розміщені одиниці. Після підстановки отриманого у такий спосіб поліно- 
ма у вираз (9) формуємо функціонал, який необхідно мінімізувати відносно вектора 
параметрів а моделі (6). На відміну від задачі мінімізації функціонала (1), яка звелась 
до розв'язку лінійного матричного рівняння (3), тепер ми отримуємо задачу нелінійної 
безумовної мінімізації. Враховуючи те, що функціонал (9) має досить складну струк- 
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туру, був вибраний безградієнтний метод Нелдера-Міда знаходження мінімуму зада- 
чі (9) (4|. Як нульове наближення використовувався розв'язок, який дає мінімізація 
функціонала (1). У результаті на кроці К2 отримують значення параметрів а, моделі (6) 


та її мінімальне значення тіп (а, й ) , 4 -1,Г, де / - кількість одиниць у вибраній хро- 
аа 


мосомі. 

КЗ3. Перевірка умови зупинки алгоритму. Для кожної хромосоми обчислю- 
ють значення функціонала (9)- І (а 5 і вибирають мінімальне значення серед них: 
(а, ) - тіп:Е (а,). (10) 


де 


о 
Якщо мінімальне значення (10) критерію селекції (9) не перевершує деякого до- 
датного значення є, то відбувається зупинка алгоритму. Зупинка алгоритму також 
може відбутися у випадку, коли його виконання не приводить до покращення розділь- 
ної функції або у тому випадку, коли алгоритмом уже виконано задане число ітерацій. 

Після виконання однієї із трьох умов із популяції вибирається хромосома с/, 
для якої виконується умова (10). Ця хромосома 1 задає структуру моделі оптимальної. 

КА. Селекція хромосом. За розрахованими на другому кроці значеннями розділь- 
ної функції здійснюється відбір тих хромосом, які будуть брати участь у створенні 
потомків для наступної популяції. Такий вибір проводиться відповідно до принципу 
природного відбору, коли найбільші шанси у створенні нової популяції мають хромо- 
соми з найкращим значенням функції пристосування, тобто такі, що забезпечують мі- 
німальне значення критеріїв селекції (1). 

Найбільш поширеними методами селекції |5| є метод рулетки і метод турнірної 
селекції. Метод рулетки можна застосовувати тільки у задачах максимізації (5|. Тур- 
нірний метод можна використовувати як у задачах максимізації, так 1 у задачах міні- 
мізації функцій. При турнірній селекції всі хромосоми розбиваються на підгрупи з 
наступним вибором 3Зіз кожної утвореної підгрупи хромосоми з найкращою присто- 
сованістю. Підгрупи можуть мати довільний розмір, але частіше за все популяції ді- 
лять на підгрупи по 2 - 3 особини у кожній. 

КУ. Формування нової популяції потомків здійснюється за допомогою двох 
основних операторів: схрещування і мутації. Слід відмітити, що оператор мутації віді- 
грає другорядну роль порівняно з оператором схрещування. Це означає, що у гене- 
тичному алгоритмі схрещування проводиться майже завжди, а мутація -- досить рідко. 
Вірогідність схрещування досить велика (0,5 4 Р. 41), тоді як ймовірність мутації ви- 
бирається досить малою (0 «Р, « 0,1). 

Оператор мутації з ймовірністю Р, змінює значення гена в хромосомі на проти- 
лежне, тобто з 1 на 0 чи з 0 на 1. Ймовірність мутації Р, може емалюватись випадко- 
вим чином випадковим вибором числа із інтервалу |0;1| для кожного гена і відбором 
для виконання цієї операції тих генів, для яких розігране число виявиться меншим 
аби рівним Р, . Мутація може здійснюватись як над пулом родичів, так і над пулом 


потомків. 
Оператор схрещування складається із двох етапів. На першому етапі формують- 
ся підгрупи із 2 осіб, звідки вибирається найкраща хромосома за критерієм селекції 


Б (сл") зті К (сі, ) . У результаті отримуємо нову популяцію хромосом, до якої засто- 


совують оператор другого етапу. 
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На другому етапі здійснюється схрещування. Для цього із пулу родичів М (Ю) ви- 
падковим чином з ймовірністю Р. утворюють пари у такий спосіб. Із популяції осіб 
випадковим чином вибирається пара хромосом. Генерується випадкове число Р. із ін- 
тервалу |0; 1), 1 якщо його значення не більше ніж Р.,, то над парою хромосом здійс- 


нюється схрешування. У протилежному випадку пара хромосом залишається без зміни. 
Потім для кожної пари родичів розігрується позиція гена (локус) в хромосомі, що ви- 
значає точку схрещування. Якщо хромосома кожного із родичів включає у себе п ге- 
нів, то точка схрещування /, -- це натуральне число, яке менше п. Тому фіксація точки 


схрещування зводиться до випадкового вибору цілого числа із інтервалу |1; І. - 1. 


Дія оператора схрещування приводить до того, що із пари родичів утворюється нова 
пара потомків наступним чином: перший потомок у парі, хромосома якого на позиціях 
від І до І, складається із генів першого родича, а на позиція від /, 41 до п із генів 


другого родича; другий потомок у парі, хромосома якого на позиціях від І до /, скла- 
дається із генів другого родича, а на позиція від 2, - 1 до п із генів першого родича. 


Після виконання оператора схрещування відбувається перехід до К2. 


Приклад побудови роздільної поверхні 


Сучасні газоперекачувальні агрегати (ГПА) оснащені інформаційно-вимірюваль- 
ними системами, які серед інших технологічних параметрів вимірюють такі вібраційні 
характеристики відцентрових нагнітачів (ВЦН) природного газу, як віброшвидкість 
та віброприскорення. Місце встановлення вібродавачів, методика проведення випро- 
бувань і визначення вібраційних характеристик ВЦН регламентуються нормативними 
документами |6), |7|. Відповідно до |7| технічного стану підшипників ВЦН характе- 
ризується середніми квадратичними значеннями віброшвидкості с, (мм/с) та середні- 


ми квадратичними значеннями віброприскорення о, (м/с). 


При такому способі періодичного контролю технічного стану ГПА може відбу- 
тися пропуск моменту, коли вібраційні характеристики вийдуть за допустимі межі. 
Як альтернативу у роботі |3| запропоновано перейти до оперативного технічного діаг- 
ностування окремих вузлів ГПА, за якого надходження інформації про технічний стан 
об'єкта відбувається із наперед заданою стратегією у процесі функціонування об'єкта. 

Задачу оперативного технічного діагностування стану ГПА за результатами вібро- 
контролю автори роботи |3| розглядають як задачу розпізнавання образів, коли техніч- 
ний стан ГПА характеризується певним набором діагностичних параметрів. Зміна діаг- 
ностичних параметрів приводить до зміни технічного стану ГПА, так що сукупність 
таких технічних станів можна розглядати як деякий клас об'єктів. 

Отже, задача розпізнавання образів -- це процес, який дозволяє віднести той чи ін- 
ший об'єкт до певного класу за умови, що класи наперед визначені (відомі прецеденти). 

З метою перевірки розробленої методики розбиття простору ознак і побудови роз- 
дільної кривої на компресорній станції КС-3 Долинського лінійного управління магі- 
стральних газопроводів ДП «Прикарпаттрансгаз» здійснювався вібраційний контроль 
ОУП відцентрового нагнітача ГПА-ЦІ-16С/76- 1,44 з газотурбінним привідним двигу- 


ном ДГ-90Л2. Через одну секунду реєструвались горизонтальні (з; - з) і вертикаль- 


28 «Искусственньй интеллект» 272010 


Синтез функцій класифікації на основі генетичних алгоритмів АГ 


ні (Зі б м складові віброприскорення за допомогою штатних технічних засобів, якими 


оснащена компресорна станція КС-3. Спостереження здійснювались протягом 75,94 год. 
Для зменшення об'єму вхідної інформації із масиву даних вилучались точки з одна- 
ковими координатами. У результаті початковий масив даних скоротився із 273394 до 
34 точок. Відповідно до |7| для кластеризації отриманих даних було вибрано три класи. 
Для розбиття діагностичних ознак на класи була використана мережа Кохонена |З). 
Результат роботи нейромережі ілюструє рис. 1, де кружками відмічені центри клас- 
терів, а цифри біля кружків означають номери класів. Перший, найнижчий, клас утво- 
рюють дані, які характеризують мінімальний рівень вібрації. Другий клас утворюють 
дані із середнім рівнем вібрації 1, на кінець, третій, найвищий, клас характеризує ви- 
сокий рівень вібрації. 


2, М/С? 
28 


і і і 2,, м/с? 
5 10 15 20 26 30 36 9" 


Рисунок 1- Результат розбиття діагностичних ознак на класи за допомогою мережі 


Для побудови роздільної кривої між першим 1 другим та між другим 1 третім кла- 
сами був вибраний поліном третьої степені. Синтез полінома оптимальної складності 
здійснювався на основі функціонала (9) і за допомогою розробленого генетичного ал- 
горитму. Параметри алгоритму були такими: а-1; В - 0,01; розмір популяції - 100; 
максимальна кількість генерацій - 100; ймовірність схрещування - 0,8; ймовірність 
мутації - 0,1. 

У результаті отримали: 

- рівняння першої роздільної кривої: 

7(х.а)за, зад аз, Раз, 
де а, - -0,232874; а, - 0,264554; а, « -0,015296; а, « -0,012428; 
- рівняння другої роздільної кривої: 
(ха) зарадх, 
де а, - 7,208388; а, - -0,305470; 
Відповідно функціонал (9) набув таких значень: 
- для першої роздільної кривої - Б, (4, ) - 0,1374; 


-- для другої роздільної кривої - К (а, з) -0,8031. 


тіп 
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Роздільні криві побудовані шляхом розв'язку рівняння /(х, а) - 0 відносно змі- 
нної х,: 
з закнанці М акад жах 
- для першої роздільної кривої - х, 2 - --- чо) 
4, 
б 2 і М а 
-- для другої роздільної кривої - х, 2 -- 
а 
1 
Результати такої побудови відтворює рис. 2, із якого видно, що першою розділь- 
ною кривою відбулося безпомилкове розмежування першого і другого класів, а друга 
роздільна крива віднесла одну із діагностичних ознак до другого класу, а іншу - до 
третього класу, хоча нейромережею вони віднесені відповідно до третього і другого 


класів. 
2,міс 
80 , 
Перша роздільна лінія Друга роздільна 
миє тнія 
70 
вої й 
50 3 
40 
30 
2 РИ 
о 
10 РЕ - 
о і 2,Мм/С 
5 10 25 30 35 
Рисунок 2 - Розбиття площини діагностичних ознак 
на класи за допомогою роздільних кривих 
Висновки 


Розроблений метод розбиття простору ознак на класи дає можливість з викорис- 
танням генетичних алгоритмів вибрати оптимальні за складністю поліноми, які опи- 
сують роздільні криві. Ефективність такого методу підтверджена на промислових да- 
них, які отримані при експлуатації ВЦН в умовах Долинського лінійного управління 
магістральними газопроводами. Отримані результати відкривають можливості до здійс- 
нення оперативного технічного діагностування окремих вузлів ГПА і виявлення вузлів 
з критичним рівнем вібрації, що робить можливою безаварійну експлуатацію ГПА. 
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М.И. Горбийчук, С.Т. Самуляк, Й.В. Щупак 

Синтез функций классификации на основе генетических алгоритмов 

В данной статье предложен метод построения разделительньх поверхностей на основе генетических 
алгоритмов. Разработанньюй способ разделения пространства признаков на классьт дабт возможность 
вьбрать оптимальньєе по сложности полиномь, описьтвающиєе разделительнье кривьве. Зффективность 
данного метода подтверждена промьшіленньми данньми. Полученньге результатьт открьтівают возможность 
проведения оперативной технической диагностики и нахождения отдельньх узлов газоперекачивающего 
агрегата с критическим уровнем вибрации, что делаєт возможной его безаварийную зксплуатацию. 
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